群体遗传结构 单倍型

----群体遗传学-------------

----单倍型分析
dnasp
MEGA
PopART
perl /share/nas6/xul/program/chloroplast/Haplotype/get_nex_with_aln_fasta_and_location_for_network.pl -h
mafft --auto --thread 30 allsample.fa > allsample.fa.aln

----fst
dnasp
arlequin

----分歧时间
进化树 外群

----分子方差分析
arlequin

AMOVA&FST

见文件AMOVA&FST/result.xml

1.用mafft比对序列,得到.fasta文件(几个群体之间) 3816项目分两次
2.将原始FASTA格式的序列文件载入DnaSP后,
点击菜单栏“Data”的“Format”,修改一些信息
点击菜单栏“Data”的“Defined Seeuence sets”对序列根据特定的性状进行分组(图1),示例数据根据地区分组,分组完毕 “Update All Entries”。

3.随后,依次点击菜单栏“Generate”->“Haplotye data file”将分组后的数据生成“Arlequin Haplotype List”文件,生成Test.arp和Test.hap 两个文件,Test.arp用Arlequin的方案文件,Test.hap为单倍型数据文件。

4.将.arp导入Arlequin软件
4.1标签切换到“Structure Edior”对不同地区的群体进行归组,示例数据的不同群体均为一个组,故“Group”均设置为“1”,并点击“Update Project”更新项目分组内容
4.2点击Structure Editor,改一下Group,可以把一个种设为一个组,也可以按照采样的省分组,也可以只分为一个组,就把0全部改为1

5.计算amova等,结果为.xml格式

Haplotype_Network

见文件夹Haplotype_Network

1.用mafft比对序列,得到.fasta文件

2.将原始FASTA格式的序列文件载入DnaSP后,  
点击菜单栏“Data”的“Format”,修改一些信息  
点击菜单栏“Data”的“Defined Seeuence sets”对序列根据特定的性状进行分组(图1),示例数据根据地区分组,分组完毕 “Update All Entries”

3.随后,依次点击菜单栏“Generate”->“Haplotye data file”将分组后的数据生成单倍型.nex文件
修改.nex文件,
MATRIX
Hap_1   


末尾添加Begin Traits; 添加分组
Begin Traits;
Dimensions NTraits=4;
Format labels=yes missing=? separator=Comma;
TraitLatitude 0 0 0 0;
TraitLongitude 0 0 0 0;
TraitLabels G J L S;
Matrix
Hap_1 1,0,0,0
Hap_2 0,1,0,0
Hap_3 0,0,1,0
Hap_4 0,0,0,1
;
End;

4.上一步的.nex文件导入PopART软件,选择Network-TCSnetwork,画图,edit选项下修改颜色

xul版已验证

cd 5.samples_hap_network

# 纯windows操作,可以参考https://blog.sciencenet.cn/blog-460481-1191502.html

1.使用mafft对齐序列,注意所有序列方向都要相同
 mafft  --quiet --auto *.fasta   > all.aln.fa

2.准备文件group.txt、location.xls
# 分组信息(没有可以省略),第一列为分组名称(地理、品种),第二列为序列名称
P1      s1
P1      s2
P1      s3
P2      s4
P2      s5
P2      s6
P3      s7
P3      s8
P4      s9
P4      s10
P4      s11
P4      s12
P5      s13
# 地理位置信息(没有可以省略),第一列为分组名称,第二列为经度信息(西经前面加负号),第三列为维度信息(南纬前面加负号)
P1      90.13431        30.45147
P2      112.2452        28.13414
P3      105.4134        30.14362
P4      100.3332        25.12222
P5      108.2434        22.42234

3.生成popart配置文件
1)没有分组信息的,将每条序列当成一个分组
cp_get_nex_with_aln_fasta_for_network.pl -aln ycf1.aln.fa
# 结果:
# hap.fa :单倍型序列文件
# hap.nex: nex格式文件,用于输入popart软件
# hap.xls:单倍型统计结果
2)有分组信息的
#cp_get_nex_with_aln_fasta_for_network.pl -aln ycf1.aln.fa -group group.txt
perl /share/nas1/yuj/program/cp_advanced_class/chloroplasty/script/cp_get_nex_with_aln_fasta_for_network.pl -aln *.aln.fa -group group.txt
# 结果:
# 新增结果 hap_group.xls:不同组单倍型情况
3)有分组经纬度信息的
cp_get_nex_with_aln_fasta_for_network.pl -aln ycf1.aln.fa -group group.txt -location location.xls
# 结果:
# 结果和上述相同,但是nex文件中包含了单倍型信息

4.使用popart软件导入nex信息,绘图
# 单倍型网络
# File->open->nex文件->Network->TCS Network->调整图形->File->Export graphics->选择svg格式
上传服务器之后,碰到svg转换不了,以文本形式打开svg,把“<svg”标签内容放在一行,不要多行,会被识别为未闭合。

# 地理分布
# File->open->nex文件->View->Switch to network view->Map theme->Atlas->File->Export graphics->选择svg格式

# 注:nex文件放在纯英文路径的文件夹中,或者放到盘符根目录下,不然可能会识别不了。